Utilisation du contexte pour l'indexation sémantique des images et vidéos. (Using context for semantic indexing of images and videos)
نویسنده
چکیده
The automated indexing of image and video is a difficult problem because of the“distance” between the arrays of numbers encoding these documents and the concepts (e.g. people, places, events or objects) with which we wish to annotate them. Methods exist for this but their results are far from satisfactory in terms of generality and accuracy. Existing methods typically use a single set of such examples and consider it as uniform. This is not optimal because the same concept may appear in various contexts and its appearance may be very different depending upon these contexts. In this thesis, we considered the use of context for indexing multimedia documents. The context has been widely used in the state of the art to treat various problems. In our work, we use relationships between concepts as a source of semantic context. For the case of videos, we exploit the temporal context that models relationships between the shots of the same video. We propose several approaches using both types of context and their combination, in different levels of an indexing system. We also present the problem of multiple concept detection. We assume that it is related to the context use problematic. We consider that detecting simultaneously a set of concepts is equivalent to detecting one or more concepts forming the group in a context where the others are present. To do that, we studied and compared two types of approaches. All our proposals are generic and can be applied to any system for the detection of any concept. We evaluated our contributions on TRECVID and VOC collections, which are of international standards and recognized by the community. We achieved good results comparable to those of the best indexing systems evaluated in recent years in the evaluation campaigns cited previously.
منابع مشابه
Utilisation de la Fouille de Données Images pour l'Indexation Automatique des Images
Cet article introduit un nouveau challenge pour la fouille de données qui consiste en la découverte de connaissances dans des collections d’images, appelé également Fouille de Données Images (Image Mining (IM)). Dans le but d’une indexation sémantique des images, nous nous focalisons sur le problème de la découverte de connaissances à partir du contenu des images d’un enesemble d’apprentissage,...
متن کاملModèle d'indexation de documents peu symboliques dans des documents structurés: L'exemple du graphique dans un corpus de documents techniques
RÉSUMÉ. Cet article s’intéresse à l’indexation des données ayant une sémantique pauvre dans des documents structurés. Le but est d’exploiter le contenu des données symboliques avoisinantes afin d’en extraire les fragments adéquats pour compléter l’indexation de la donnée non symbolique. Cette approche a été abordée dans le cadre concret d’une application dans un contexte professionnel : indexer...
متن کاملProfil générique sémantique pour ladaptation de documents multimédias
RÉSUMÉ. Actuellement, les documents multimédias peuvent être consultés à tout moment et n’importe où sur une grande variété de dispositifs mobiles. L’hétérogénéité de ces plateformes, les préférences utilisateurs mais également le contexte de consultation impose des adaptations de documents à certaines contraintes, comme par exemple, ne pas jouer de contenus audio lorsque l’utilisateur particip...
متن کاملVers une indexation sémantique d'images dans un fonds iconographique territorialisé
Dans cet article, nous abordons nos travaux pour indexer et faire des recherches sur une base d’images telle que celle mise à notre disposition par la médiathèque de Pau. Le but est de proposer une méthode, des outils et techniques et un modèle sémantique pour identifier automatiquement des objets ayant pour nous un intérêt visuel, par exemple un clocher, une statue. Afin de mener à bien cette ...
متن کاملUsing distributed word representations for robust semantic role labeling (Utilisation de représentations de mots pour l'étiquetage de rôles sémantiques suivant FrameNet) [in French]
Résumé. D’après la sémantique des cadres de Fillmore, les mots prennent leur sens par rapport au contexte événementiel ou situationnel dans lequel ils s’inscrivent. FrameNet, une ressource lexicale pour l’anglais, définit environ 1000 cadres conceptuels couvrant l’essentiel des contextes possibles. Dans un cadre conceptuel, un prédicat appelle des arguments pour remplir les différents rôles sém...
متن کامل